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摘 要 : 近 地 表 气温 是 衡量 城市 热 环 境 的 重要 因素 , 城 六 


站 严重 不 足 限 制 了 异 质 城市 内 气温 的 空间 连续 分 布 


和 气温 被 认为 是 各 种 城市 问题 的 重要 变量 ,然而 小 区 域 气象 
CE 示 。 为 获得 空间 连续 分 布 的 近 地 表 气温 , 利 


j 遥 感 数据 结合 


随机 森林 机 器 学 习 法 来 估算 城市 近 地 表 空 间 连续 分 布 的 气温 。 本 文 以 兰州 市 为 研究 区 ,利用 MODIS 传感器 的 前 


一 天 和 当天 8 个 不 同时 间 点 的 地 表 温 度数 据 , 结 合 一 系列 


影响 因子 ,利用 随机 森林 来 估算 城市 的 每 日 最 高 气温 和 


Igi GR CT V Tu) FEE 8 个 时 序 的 地 表 温度 数据 与 Ts/Tu 存 在 不 同 的 相关 关系 ,根据 这 种 关系 设计 了 输入 
不 同 地 表 温 度数 据 的 8 个 模型 方案 ,利用 实测 气温 对 不 同 模型 方案 的 结果 进行 验证 ,获得 最 佳 方案 佑 算 的 日 最 高 


气温 和 最 低 气 温 。 结 果 表 明 ,用 随机 森林 模型 结合 遥感 数据 来 估算 城市 日 近 地 表 气温 是 可 行 的 ,并 且 前 


表 温 度 对 气温 影响 较 大 ,是 估算 气温 的 关键 参数 。 


天 的 地 


关键 词 : 地 表 温 度 ; MODIS; 随机 森林 ; 近 地 表 气温 ; 兰州 市 


城市 景观 作为 地 表 的 一 部 分 ,对 区 域 范围 内 的 
环境 有 着 巨大 的 影响 ,尤其 是 最 高 气温 和 最 低 气温 
的 估算 在 人 口 稠密 的 地 区 至 关 重 要 。 由 于 城市 人 口 
众多 且 基 础 设施 复杂 ,城市 内 气温 的 微小 变化 可 能 
会 对 人 类 和 自然 环境 产生 很 大 影响 "| 。 

近 地 表 气温 是 地 面 气象 站 测定 的 常规 要 素 之 
一 ,是 引起 气候 变化 的 关键 参数 ,同时 也 是 研究 各 种 
气候 模型 的 一 个 重要 变量 。 由 于 城市 中 气象 站 点 较 
少 且 分 布 分 散 ,利用 插值 的 方法 无 法 准确 表示 城市 
气温 的 空间 分 布 ,然而 遥感 观测 能 够 提供 大 范围 的 
全 球 陆 面 信息 ,例如 地 表 温 度 .植被 指数 等 ,这 使 得 
可 以 利用 遥感 获取 的 与 城市 气温 高 度 相关 的 地 表 信 
息 来 估算 城市 气温 “1。 

如 何 获 取 空 间 连 续 分 布 的 近 地 表 气温 一 直 是 国 
内 外 的 研究 热点 之 一 。 近 年 来 ,国内 外 学 者 开始 利 
用 遥感 数据 估算 近 地 表 气温 ,但 大 多 以 月 和 年 为 尺 
度 , 很 少 有 以 天 为 尺度 的 研究 "21 。 目 前 , 比较 成 
熟 的 气温 估算 方法 可 以 总 结 为 4 种 5 OD. 简单 统 
计 方 法 ,就 是 根据 地 表 温 度 和 近 地 表 气温 的 高 度 相 
关 性 ,建立 简单 的 一 元 线性 回归 模型 对 气温 进行 计 
算 ,Davis 等 中 根据 一 元 线性 回归 模型 计算 得 出 的 


© 收 稿 日 期 : 2019 -07 -01; 修订 日 期 : 2019 -09 -28 


北美 地 区 的 气温 标准 差 在 1.6 -2.6 "Cz RI, Qm 
级 统计 方法 , 指 在 一 元 线性 回归 模型 的 基础 上 ,考虑 
多 个 不 同 因 子 对 气温 的 影响 ,如 NDVI\ 叶 面积 指数 、 
太阳 天 项 角 、 饱 和 差 .相对 湿度 、 经 纬度 及 海拔 高 度 
等 。 常 用 的 2 个 模型 为 多 元 回归 模型 和 神经 网 络 模 
型 。Cresswell 5x 5! 以 地 温 .太阳 天 顶 角 为 影响 
子 ,建立 了 与 气温 的 多 元 回归 模型 ,计算 得 出 的 气温 
值 与 观测 值 误 差 在 0.09 ~1.69%。@TVX 法 , 利 
用 此 方法 的 前 提 是 在 气压 和 湿度 条 件 一 致 的 浓密 植 
被 覆盖 条 件 下 ,植被 冠 层 表面 温度 接近 地 表 温 度 且 
地 表 温 度 与 NDVI 呈 负 相关 关系 。 利 用 其 相关 关系 
来 估算 气温 …“ , Stisen 等 ”将 TVX AA E 
函数 插值 法 来 估算 近 地 表 气温 ,计算 得 出 的 均 方 根 
误差 在 2.55 ~2.99 C ,这 种 方法 涉及 条 件 较 多 且 考 
虑 的 变量 少 ,气温 模拟 结果 精度 较 差 。@ 能 量 平衡 
方法 ,是 指 建立 地 表 能 量 平衡 方程 来 进行 气温 反 演 
研究 ,Pape 等 "结合 台 站 观测 数据 ,利用 遥感 提取 
的 下 执 面 植被 及 地 貌 数据 为 参数 建立 了 地 表 能 量 平 
衡 方程 ,得 出 气温 的 均 方 根 误差 在 0.37 ~1.02 ©, 
由 于 该 方法 所 需 参 数 较 多 ,空间 分 布 的 参数 不 易 获 
取 , 使 得 这 种 方法 在 应 用 上 存在 一 定 的 限制 。 
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在 一 个 城市 中 自然 因素 和 人 为 因素 在 不 同 空间 
尺度 上 混合 ,使 得 在 城市 里 估算 近 地 表 气温 变 得 难 
以 实现 ,这 使 得 我 们 必须 探索 更 为 先进 的 方法 来 估 
算 气 温 。 近 年 来 ,机 器 学 习 方 法 逐渐 成 熟 Bog E 
的 学 者 将 其 应 用 于 不 同 的 领域 。 在 地 理学 方面 , 陈 
浩 等 所 利用 机 器 学 习 中 5 种 模型 模拟 了 青藏 高 原 
日 降水 数据 ; 顾 峰 等 ”结合 Sentinel -2 数据 ,使 用 
随机 森林 算法 估算 了 干旱 区 典型 绿洲 植被 叶绿素 含 
量 。 事 实证 明 机 器 学 习 在 具有 复杂 和 异 质 景观 的 区 
域 中 是 灵活 的 ,不 同学 者 开始 将 随机 森林 方法 用 于 
气温 的 研究 1。 白 琳 等 基于 Landsav TM 数据 
反 演 了 北京 市 的 近 地 表 气温 。 也 有 学 者 使 用 MO- 
DIS 地 表 温 度 估算 近 地 表 气温 ,但 都 是 采用 当 
天 的 瞬时 地 表 温 度 。 由 于 气温 的 滞后 性 ,前 一 天 的 
地 表 温 度 与 气温 的 相关 性 可 能 会 更 高 ,因此 ,本 文 以 
兰州 市 为 研究 区 ,利用 8 个 不 同时 间 的 MODIS 地 表 
温度 产品 ,并 结合 高 程 .NDVI、 坡 度 、 坡 向 和 太阳 辐 
射 5 个 因子 作为 随机 森林 的 输入 因子 ,设计 了 不 同 
模型 方案 来 估算 城市 日 最 高 和 最 低 气温 ,并 对 不 同 
模型 方案 的 结果 进行 验证 ,获得 估算 城市 近 地 表 气 
温 的 最 佳 方案 。 


1 数据 来 源 与 研究 方法 


1.1 研究 区 概况 与 数据 来 源 


1.1.1 研究 区 概况 ”兰州 市 位 于 甘肃 省 的 中 部 
(图 1) ,其 总 面积 约 为 13 271 km ,平均 海拔 1500 m, 
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图 1 研究 区 位 置 示意 图 


Fig.1 Location of study area diagram 


104?*0'E 104*30'E 


ChinaXiv 合 作 期 刊 


研 究 37 卷 


主体 位 于 南北 两 山 之 间 的 黄河 谷地 ,是 典型 的 河谷 
城市 。 属 中 温带 大 陆 性 气候 ,温差 大 ,降水 少 ,由 于 
主 城区 位 于 河谷 盆地 中 ,空气 的 流动 性 差 ,城市 热岛 
效应 明显 。 

1.1.2. 数据 来 源 Terra MODIS 提供 了 当地 10:30 
(白天 ) 和 22:30( 夜 间 ) 观 测 到 的 地 表 温 度 (LST) 数 
据 ;Aqua MODIS 提供 了 当地 时 间 13:30 (白天) 和 
01:30( 夜 间 ) 观 测 到 的 LST 数据 。 本 文选 取 的 MO- 
DIS 数据 均 来 源 于 NASA 官网 ,其 中 包括 空间 分 辨 
率 为 1 km 的 地 表 温 度 日 产品 和 空间 分 辨 率 为 1 km 
的 NDVII6 天 合成 产品 。 研 究 区 行政 边界 数据 来 源 
于 国家 地 球 系统 科学 数据 共享 平台 ;DEM 数据 来 源 
于 地 理 空间 数据 云 平台 ,空间 分 辨 率 为 30 m ,坡度 、 
坡 向 数据 由 DEM 获得 。 太 阳 辐 射 数据 来 自 
AVHRR 卫星 获取 的 日 数据 ,空间 分 辩 率 为 0. 25^, 
数据 来 源 于 https ://wui. emsaf. eu/。 气 象 数据 来 源 
于 兰州 气象 局 提供 的 2014 年 兰州 5 个 站 点 全 年 气 
温 日 数据 。 本 文 用 到 的 数据 处 理工 具 主 要 有 MRT、 
python 2. 7. 15 和 ArcGIS 10.4。 所 用 的 数据 及 变量 
如 表 1 所 示 。 


A1 卫星 的 衍生 变量 及 研究 使 用 的 变量 描述 
Tab.1 Description of variables used in this study 
变量 类 型 ” 缩写 简单 描述 
LSTAN — Aqua 卫星 当天 (01 :30 ,凌晨 ) 的 地 表 温度 
LSTrp ”Terra 卫星 当天 (10:30 ,上午 ) 的 地 表 温 度 
地 表 LSTAp Aqua 卫星 当天 (13:30, 下 午 ) 的 地 表 温度 
温度 LST ”Terra 卫星 当天 (22:30, 晚 上 ) 的 地 表 温 度 
(LST) ” LSTApy Aqua 卫星 前 一 天 (01:30 ,凌晨 ) 的 地 表 温 度 
ISTrap Terra 卫星 前 一 天 (10:30 ,上午 ) 的 地 表 温度 
LSTspp Aqua 卫星 前 一 天 (13 :30 ,下 午 ) 的 地 表 温度 
LSTrex Terra 卫星 前 一 天 (22 :30 ,晚上 ) 的 地 表 温 度 
Sol 每 日 人 射 太阳 辆 射 


辅助 NDVI 归 一 化 差异 植被 指数 
变量 Elev 海拔 
(a) Asp 坡 向 
Slo 坡度 
~i T ix 最 高 气温 
气温 
fs 最 低 气温 


1.2 研究 方法 

1.2.1 RF 模型 ”随机 森林 (random forest) 是 2001 
年 由 LeoBreiman 和 Culter Adele 开发 的 一 种 数据 挖 
据 方 法“ ,与 人 工 神经 网 络 .支持 向 量 机 等 机 器 学 
习 方 法 相 比 ,随机 森林 算法 具有 运算 量 小 ,容纳 样本 


3 期 [re$ dE 


数量 大 等 优点 ”i 。 随 机 森林 方法 对 非 线性 数据 有 
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着 更 好 的 拟 合 效果 ,减少 了 均 方 根 误 差 .提高 了 模型 
hii sU 。 

本 文通 过 Python 2.7. 15 中 Pandas 准备 数据 框 
数据 ,再 导入 Skleam 工具 包 。 在 Sklearn 模块 库 中 ， 
利用 一 系列 运算 代码 实现 随机 森林 模型 估算 气温 。 
以 8 个 地 表 温 度 和 辅助 变量 “wa ”为 自 变 量 , 因 变量 
F TS Tu! BEBLEEMORARTEHOPURUDL TR D 7. 

(1) 用 Bootstrap 法 在 N 个 总 样本 中 有 放 回 的 
随机 抽取 nn 次 ,得 到 个 自助 样本 集 作 为 训练 集 , 未 
抽取 的 部 分 组 成 袋 外 数据 。 

(2) 将 每 个 训练 集 都 单独 作为 一 棵 决策 树 , 决 
策 树 节 点 从 自 变量 中 选择 M RCM INT BRE UIS 
数 ) ,并 按照 节点 不 纯洁 度 最 小 原则 进行 分 文生 长 。 

(3) 重复 步骤 (2)n 次 ,得 到 nn 棵 决策 树 组 成 随 
机 森林。 对 于 每 一 棵 决策 树 都 可 以 得 到 一 个 00B 
误差 估计 ,将 和 森林 中 所 有 决策 树 的 OOB 误差 估计 取 
平均 值 ,可 得 到 随机 森林 的 泛 化 误差 估计 。 

1.2.2 模型 设计 由 于 本 文 研究 区 较 小 ,气象 站 点 
的 数量 较 少 ,为 了 使 模拟 时 的 实测 数据 更 多 ,模拟 结 
果 更 加 精确 ,挑选 了 2014 年 全 年 12 d 数据 质量 较 
好 , 且 比 较 有 代表 性 的 站 点 数据 (相当 于 60 个 站 


最 终 确 定 了 53 个 站 点 数据 ,随机 选取 了 30 个 站 点 ， 
以 这 些 天 的 数据 为 例 ,将 这 些 天 不 同时 间 的 8 个 地 
表 温度 数据 分 别 与 城市 的 7,。( 右 ) 和 Ti,( 左 ) 做 相 
关 性 分 析 ,研究 地 表 温 度 与 最 低 最 高 气温 的 相关 关 
系 ,结果 如 图 2 所 示 。 从 图 2 可 以 看 出 ,每 天 的 Tan 
和 7, 与 不 同时 间 获 取 的 LST 有 不 同 的 关系 ,Aqua 
卫星 晚上 所 获取 的 地 表 温 度 与 了 的 相关 性 最 高 ， 
这 表明 可 以 用 晚上 所 获取 的 地 表 温 度数 据 来 估算 
7 两 个 卫星 白天 所 获取 的 地 表 温 度 与 也. 的 相关 
性 并 不 是 最 高 的 ,Terra 卫星 前 一 天 夜晚 与 Tra TH 
关 性 最 高 ,所 以 需要 设计 不 同 模型 ,选择 最 优 的 方法 
来 估算 气温 。 表 2 分 别 列 出 了 依据 相关 分 析 设 计 的 
7 和 7 的 不 同 模型 估算 方案 (S1 ~ S8 ) ,S1 方案 
具有 与 也 .或 Tu 相关 性 最 高 的 LST,S2 方案 是 在 
S1 的 基础 上 添加 与 Toa R 7 相关 性 第 二 高 的 
LST。 剩 余 的 方案 按 相 关 顺 序 连 续 的 添加 LST ,最 后 
一 个 方案 包含 所 有 的 LST 数据 。 气 温 除 了 与 地 表 
温度 有 关 之 外 ,还 与 NDVI\ 太 阳 辐 射 海拔 坡度 和 
坡 向 有 关系 ,所 以 ,在 每 种 方案 中 都 包含 这 几 个 因 
子 , 这 几 个 因子 用 a 表示 ( 表 1) 。 设 计 好 方案 后 ,将 
不 同方 案 输 入 到 随机 森林 的 模型 进行 估算 。 


as 
1 0.9 0.8 0.7 0.6 0.5 0.5 0.6 0.7 0.8 0.9 1 
相关 系数 相关 系数 
图 2 最 高 气温 和 最 低 气温 与 地 表 温度 的 相关 系数 
Fig.2 Coefficient of correlation between Tna and Tain with surface temperature 
2 £&RA 始 降低 , 随 着 进入 更 多 的 LST 数据 而 降低 ,这 是 由 


2.1 模型 性 能 评估 

在 最 终 确 定 的 53 个 站 点 数据 中 选取 了 40 个 站 
点 作为 模型 的 训练 数据 ,13 个 站 点 (第 9%7 197 d 和 
297 d 站 点 数据 ) 作为 模型 的 验证 数据 ,模型 的 验证 
结果 如 表 3 所 示 ,模型 的 RR 都 超过 了 0. 8 ,而 设计 
的 这 些 方案 在 输入 变量 数目 达到 一 定 的 情况 下 , 模 
型 的 R 就 趋 于 稳定 ,其 至 R 在 达到 最 高 值 后 会 开 


于 数据 的 元 余 所 导致 的 ,模型 会 将 多 余 的 数据 当做 
无 效 数据 把 其 排出 在 外 。 在 估算 最 高 温度 的 模型 中 
S6 显示 了 最 高 的 性 能 ,模型 的 R? 达到 0. 921 ,估算 
值 与 站 点 实测 值 之 间 的 R 系数 为 0.733 ,平均 绝对 
误差 为 1.344 C 。 平 均 绝对 误差 可 以 准确 反映 实际 
估算 误差 的 大 小 ,所 以 用 平均 绝对 误差 来 评估 方案 。 
而 在 佑 算 最 低 气温 的 模型 中 ,S2 显示 了 最 高 的 性 
能 , 模型 的 RR 为 0.916, 估算 值 与 站 点 实测 值 之 间 
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表 2 模型 的 具体 设计 方案 
Tab.2 Specific design scheme of model 


N a 
min 输入 变量 


T max 输入 变量 


Sl LSTreN ta 

S2 LSTreN +LSTABN +a 

S3  LSTrgs +LSTagy t LST agp +Q 

S4  LSTrg +LSTABN + LSTApp + LSTrgp + o 

S5 LSTqg, +LSTABN t LSTApp + LSTrgp +LSTAN +a 

S6 LSTrsy +LSTABN + LST agn + LSTrgp + LSTry +LSTAN +Q 

S7 LST4gw + LSTABN + LSTAspD + LSTrep + LSTN + LSTAN + 
LST ip +a 


Sg LSTqyy + LSTABN +LSTAsp + LSTrpp +LSTIN +LSTAN + LSTAp 
+LSTrp +a 


Sl LSTAN +a 

S2 LSTAN € IST +a 

S3 LSTAN + LST +LSTAsN +a 

S4 LSTay +ILSTN  LST gy € LSTqgy +a 

S5 LSTAN +ILSTiN + LST apy +LSTeN  LSTqgp +a 

S6 LSTAN +ILSTw + LST apy + LSTigy  LSTqgp + LST agp +a 

S7 LSTAN +LSTw  LST aps + LSTrew + LSTrgp  LST app + LST 
ta 


Sg  LSTay € IST, € LST uy + LSTqg, +LSTiap + LST hpp + LSTqy 


+LSTAp +a 


表 3 模型 的 验证 
Tab.3 Verification of the model 


方案 (Th) R 系数 模型 R? MAE/*C RMSE/C | TRT mn) WW R R 系数 MAE/*C RMSE/'C 
S1 0. 689 0.816 2.332 2.598 S1 0. 876 0.784 1.261 1.637 
S2 0. 691 0.820 2.375 2.650 S2 0.916 0.816 1.218 1.596 
S3 0. 697 0.892 1.663 1.801 S3 0. 886 0.630 1.305 2.155 
S4 0.713 0.912 1.534 1.648 S4 0. 882 0.666 1.276 2.049 
S5 0. 729 0.918 1.513 1.632 S5 0. 864 0.686 1.297 2.036 
S6 9. 733 9.921 1.344 1.501 S6 0. 870 0.699 1.366 2.056 
S7 0. 733 0.912 1.352 1.516 S7 0. 855 0.701 1.319 2.014 
S8 0. 706 0.913 1.416 1.538 S8 0. 867 0.678 1.361 2.126 


Hy R^ 系数 为 0.816 ,平均 绝对 误差 为 1.218 C. 

在 估算 最 高 气温 的 模型 中 ,用 了 前 一 天 地 表 温 
度 的 数据 ,可 见 ,前 一 天 的 地 表 温 度 对 气温 的 估算 有 
很 大 的 作用 , 故 可 以 根据 前 一 天 的 地 表 温 度 来 估算 
后 一 天 的 最 高 气温 。 在 了 ,估算 的 模型 中 ,前 4 种 
方案 所 用 到 的 地 表 温 度数 据 均 为 晚上 获取 的 (2 个 
当天 ,2 个 前 天 ) ,所 以 说 可 以 用 前 一 天 晚上 的 地 表 
温度 数据 来 估算 后 一 天 的 最 低 气 温 。 统 筹 这 些 方 


29 [ (a)S6(T,.) 
27 | y-1.188 1x-5.312 4 


R?-0.733 


估算 气温 值 /位 


MAE-1.344 

21r RMSE-1.501 

19 一 一 一 
21 23 25 27 29 


站 点 气温 值 / 攻 


注 :MAE 为 平均 绝对 误差 ;RMSE 为 均 方 根 误差 。 加 粗 的 S2 和 S6 分 别 为 最 佳 方案 。 


案 , 晚 上 所 获取 的 地 表 温 度 与 最 高 气温 和 最 低 气 温 
的 相关 性 都 较 高 。 这 可 能 是 由 于 兰州 是 山谷 型 城 
市 ,白天 气温 上 升 不 均匀 ,而 晚上 在 卫星 过 境 时 大 气 
的 保温 作用 使 气温 下 降幅 度 不 大 的 原因 。 无 论 是 最 
高 气温 还 是 最 低 气 温 的 估算 ,随机 森林 模型 都 显示 
了 很 好 的 效果 ,最 后 绘制 了 2014 年 第 97 .197 .297 d 
估算 的 最 高 和 最 低 气 温 与 站 点 气温 的 散 点 图 
(图 3)。 
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图 3 估算 气温 与 站 点 气温 散 点 图 


Fig.3  Scatter plot of estimated temperature and site temperature 
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图 4 2014 年 第 97 、197 297 d 最 高 /最 低 气 温 模拟 图 


Fig.4 Maximum/minimum temperature simulation for 97 ,197 ,297 days ,2014 


2.2 空间 结果 分 析 

本 文 以 2014 年 第 97 .197 d 和 297 d 兰州 市 数 
据 质量 比较 好 的 这 几 天 为 例 , 将 地 表 温 度 LOK BH RR 
射 海拔 坡度. 坡 向 和 NDVI 数据 输入 随机 森林 模 
型 ,利用 方案 6 和 方案 2 分 别 计算 获得 了 兰州 市 
2014 年 第 97 .197 d 和 297 d 近 地 面 的 最 高 气温 
最 低 气 温 的 空间 分 布 图 (图 4)。 

从 图 4 可 以 看 出 ,用 随机 森林 很 好 地 模拟 了 气 
温 的 空间 分 布 , 且 每 幅 图 都 存在 着 显著 的 空间 差异 
性 ,兰州 中 心 城区 和 黄河 沿岸 地 区 气温 较 高 ,呈现 出 
一 定 的 热岛 效应 。 而 在 南部 和 北部 的 山地 地 区 ,由 
于 地 形 和 海拔 的 原因 气温 比较 低 。 气 温 呈 现 出 由 黄 
河 向 南北 方向 降低 的 规律 ,符合 海拔 越 高 气温 越 低 
的 规律 。 无 论 是 最 高 气温 模型 还 是 最 低 气 温 模型 所 
估算 的 温度 都 在 合理 的 范围 之 内 ,很 好 地 反应 了 兰 
州 市 2014 年 第 97 .197 d 及 297 d 最 高 气温 和 最 低 
气温 的 空间 分 布 状况 。 


3 ”结论 与 讨论 


本 文 比 较 了 8 个 不 同时 间 的 地 表 温 度 和 最 高 、 
最 低 气 温 的 相关 性 ,采用 随机 森林 方法 结合 MODIS 


传感器 前 一 天 和 当天 的 多 时 间 序 列 地 表 温 度数 据 ， 
估算 了 兰州 市 近 地 表 最 高 和 最 低 气 温 ,评估 了 8 种 
不 同 的 组 合 方案 ,获得 了 估算 气温 的 最 佳 方案 ,并 用 
最 佳 方案 模拟 了 兰州 市 的 最 高 最 低 气 温 。 通 过 本 文 
的 研究 可 得 出 以 下 主要 结论 : 

(1) 随机 森林 结合 前 一 天 和 当天 的 MODIS 地 
表 温 度数 据 ,可 以 很 好 地 估算 近 地 表 气温 ,并 且 模 拟 
精度 较 高 ,是 获得 空间 连续 分 布 气温 数据 的 很 好 途 
径 。 

(2) 利用 MODIS 遥感 数据 估算 气温 时 , 当天 所 
获取 的 地 表 温 度 与 当天 最 高 气温 及 最 低 气温 的 相关 
性 并 不 是 最 高 的 ,前 一 日 地 表 温 度 与 最 高 和 最 低 气 
温 相 关 性 比较 高 ,前 一 天 所 获取 的 地 表 温 度 对 近 地 
表 气 温 的 估算 至 关 重 要 ,在 模型 设计 时 必须 考虑 引 
入 前 一 天 所 获取 的 地 表 温 度 。 

(3) 在 高 海拔 、 地 形 较为 复杂 的 兰州 市 , 佑 算 气 
温 时 除了 地 表 温 度 之 外 ,还 应 考虑 更 多 的 变量 ,如 高 
T .坡度 . 坡 向 ,太阳 辐射 和 归 一 化 植被 指数 。 

本 文 很 好 地 模拟 了 不 同时 间 点 的 连续 空间 分 布 
气温 ,具有 很 好 的 空间 连续 性 。 由 于 受 获 取 的 遥感 
数据 影响 ,尤其 是 以 日 为 时 间 分 辨 率 的 研究 ,时 间 尺 
度 上 不 连续 ,无 法 揭示 出 气温 的 时 间 变 化 。 所 以 ,在 
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利用 遥感 数据 来 估算 近 地 表 气温 的 研究 还 需要 不 断 
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Estimation of daily maximum and minimum temperature of Lanzhou 
City based on MODIS and random forest 


XING Li-ting, Ll Jing, JIAO Wen-hui 
( College of Geographical and. Environmental Science , Northwest Normal University , Lanzhou 130070 , Gansu , China ) 


Abstract: ^ Near-surface temperature is an important factor for measuring the urban thermal environment. Urban 
temperature is considered to affect various urban problems. However, the meteorological stations in small regions 
are insufficient to enable sufficient recording of temperature across heterogeneous cities. Remote sensing data com- 
bined with the random forest machine learning method was used to estimate the continuous near-surface temperature 
of Lanzhou. The random forest approach uses the previous day's surface temperature data from a MODIS sensor for 
eight different time points in the day, combined with a series of influencing factors, to estimate the daily maximum 


and minimum temperature ( T,../T,..). Because the eight time points of surface temperature data have different 


max min 


correlations with T's/ Tmin, these different relationships are used to create eight different model schemes with differ- 


max min 9 
ent input surface temperature data, and the results of the different models are verified using the measured tempera- 
ture to obtain the best estimates of daily maximum and minimum temperatures. We found that it is feasible to use 
the random forest model combined with remote sensing data to estimate the daily and near surface temperature of 
Lanzhou city , and that the previous day 's surface temperature has a large effect on the present temperature, making 


it a key parameter for estimating temperature. 


Key words: land surface temperature; MODIS; random forest; near surface temperature; Lanzhou City 


